মডেল Export করা (Pickle, Joblib)

Machine Learning - সাইকিট-লার্ন (Scikit-Learn) - Model Deployment এবং Production

186

মডেল export বা save করার প্রক্রিয়া হল একটি মেশিন লার্নিং মডেলকে ডিস্কে সংরক্ষণ করা, যাতে তা ভবিষ্যতে পুনরায় ব্যবহার করা যায়। এটি অনেক ক্ষেত্রে কার্যকরী হতে পারে, যেমন:

প্রোডাকশনে মডেল ব্যবহার করার জন্য।
মডেল পুনরায় ট্রেন না করে reuse করার জন্য।
মডেল ডিপ্লয়মেন্ট এবং শেয়ারিংয়ের জন্য।

Python-এ মডেল export করতে দুটি জনপ্রিয় লাইব্রেরি ব্যবহৃত হয়: Pickle এবং Joblib।

1. Pickle

Pickle হল Python এর একটি বিল্ট-ইন লাইব্রেরি যা Python অবজেক্টগুলোকে স্টোর এবং পুনরুদ্ধার করতে ব্যবহৃত হয়। এটি মডেলগুলোকে binary format এ serialize করে এবং পুনরায় deserialize করে পুনঃব্যবহারযোগ্য করে তোলে।

Pickle দিয়ে মডেল Save ও Load করার প্রক্রিয়া:

মডেল Save করা:

import pickle

# মডেল ফিট করার উদাহরণ
from sklearn.svm import SVC
from sklearn.datasets import load_iris

# ডেটাসেট লোড করা
data = load_iris()
X, y = data.data, data.target

# মডেল তৈরি
model = SVC(kernel='linear')
model.fit(X, y)

# মডেল সংরক্ষণ করা
with open('svm_model.pkl', 'wb') as file:
    pickle.dump(model, file)

মডেল Load করা:

# মডেল লোড করা
with open('svm_model.pkl', 'rb') as file:
    loaded_model = pickle.load(file)

# মডেল দিয়ে পূর্বাভাস করা
predictions = loaded_model.predict(X[:5])
print(predictions)

ফায়দা:

সহজ এবং ব্যবহারযোগ্য।
Python এর ইনবিল্ট লাইব্রেরি, তাই অতিরিক্ত ডিপেনডেন্সি নেই।

সীমাবদ্ধতা:

Pickle কিছু বৃহৎ মডেল সংরক্ষণ করার ক্ষেত্রে কম্প্রেশন সমস্যায় পড়তে পারে।
কিছু সময় Python ভার্সনিং সমস্যা হতে পারে, যেখানে নতুন Python ভার্সনে পুরানো ফাইলটি কাজ নাও করতে পারে।

2. Joblib

Joblib হলো একটি Python লাইব্রেরি যা মূলত বড় প্যান্ডাস ডেটা ফ্রেম, numpy অ্যারে এবং মডেল সংরক্ষণের জন্য ব্যবহৃত হয়। এটি Pickle এর মতো কাজ করলেও, বিশেষত বড় মডেল সংরক্ষণের জন্য Joblib বেশি কার্যকরী। এটি compress করতে সক্ষম, যা বড় মডেল সংরক্ষণে সহায়ক।

Joblib দিয়ে মডেল Save ও Load করার প্রক্রিয়া:

মডেল Save করা:

import joblib

# মডেল ফিট করার উদাহরণ
from sklearn.svm import SVC
from sklearn.datasets import load_iris

# ডেটাসেট লোড করা
data = load_iris()
X, y = data.data, data.target

# মডেল তৈরি
model = SVC(kernel='linear')
model.fit(X, y)

# মডেল সংরক্ষণ করা
joblib.dump(model, 'svm_model.joblib')

মডেল Load করা:

# মডেল লোড করা
loaded_model = joblib.load('svm_model.joblib')

# মডেল দিয়ে পূর্বাভাস করা
predictions = loaded_model.predict(X[:5])
print(predictions)

ফায়দা:

Joblib বড় মডেল সংরক্ষণ এবং compress করার জন্য কার্যকরী।
ফাইল আকার ছোট করে ডিপ্লয়মেন্ট এবং শেয়ারিং সহজ করে।

সীমাবদ্ধতা:

অন্যান্য লাইটওয়েট বা ছোট মডেলের জন্য Pickle তুলনায় কিছুটা ধীর হতে পারে।

Pickle vs Joblib:

বৈশিষ্ট্য	Pickle	Joblib
ব্যবহার	ছোট মডেল এবং সাধারণ Python অবজেক্ট	বড় মডেল এবং numpy অ্যারে সহ ফিচার
প্রসেসিং গতি	সাধারণত ধীর	বড় মডেল সংরক্ষণে দ্রুত
কম্প্রেশন	কম্প্রেশন সাপোর্ট নেই	উন্নত কম্প্রেশন সাপোর্ট
বিগ ডেটা	বিগ ডেটা মডেল সংরক্ষণে অসুবিধা হতে পারে	বড় ডেটাসেট এবং মডেল সংরক্ষণের জন্য উপযুক্ত

সারাংশ:

Pickle হল একটি সাধারণ লাইব্রেরি যা ছোট মডেল এবং Python অবজেক্ট সংরক্ষণে ব্যবহৃত হয়। এটি সহজ এবং দ্রুত, কিন্তু বড় মডেল সংরক্ষণে কিছুটা ধীর হতে পারে।
Joblib বড় মডেল, যেমন SVM, RandomForest, এবং KNN এর জন্য বেশি উপযুক্ত, কারণ এটি দ্রুত এবং কম্প্রেশন সাপোর্ট করে।

যেহেতু Joblib বৃহৎ ডেটাসেট এবং মডেল সংরক্ষণে ভালোভাবে কাজ করে, তবে আপনার মডেল এবং ডেটার আকারের উপর নির্ভর করে আপনাকে সঠিক টুল নির্বাচন করতে হবে।

Content added By

SATT Academy

Flask এবং FastAPI দিয়ে REST API তৈরি Docker ব্যবহার করে মডেল ডেপ্লয়মেন্ট ক্লাউডে মডেল ডেপ্লয়মেন্ট (AWS, Google Cloud, Azure)

মডেল Export করা (Pickle, Joblib)

1. Pickle

Pickle দিয়ে মডেল Save ও Load করার প্রক্রিয়া:

ফায়দা:

সীমাবদ্ধতা:

2. Joblib

Joblib দিয়ে মডেল Save ও Load করার প্রক্রিয়া:

ফায়দা:

সীমাবদ্ধতা:

Pickle vs Joblib:

সারাংশ:

Promotion

Satt AI

Hi, আমি SATT AI!

মডেল Export করা (Pickle, Joblib)

1. Pickle

Pickle দিয়ে মডেল Save ও Load করার প্রক্রিয়া:

ফায়দা:

সীমাবদ্ধতা:

2. Joblib

Joblib দিয়ে মডেল Save ও Load করার প্রক্রিয়া:

ফায়দা:

সীমাবদ্ধতা:

Pickle vs Joblib:

সারাংশ:

All Notifications

Promotion

Satt AI

Hi, আমি SATT AI!